3分钟,看懂假设检验
大家好,我是爱学习的小xiong熊妹。
今天来说说假设检验。这是个古老的方法,近年ABtest大行其道,使假设检验方法迎来了新一波文艺复兴,搞得很多小伙伴都在问:如何做假设检验?那一堆似懂非懂的统计符号啥意思?
今天小熊妹帮大家整理了一个懒人攻略,大家抄起来用即可。可能有描述不准确的地方,大神们勿喷哦。
一、假设检验是干什么的?
假设检验最常见的场景有两个:
总之是吵架必备,怼人利器。
二、什么时候适合用假设检验?
当错误很明显的时候,不需要做假设检验。比如销售、运营的表现不好,可以直接取过往X天的销售业绩、运营指标来看。如果销售业绩一直下滑,还有啥好说的,这时候不需要假设检验,直接开怼。
有些问题不那么明显,比如上边吐槽的产品寿命问题。除非产品用到烂,否则不知道寿命是多少。而当用户遇到产品寿命很短的问题的时候,他们只会默默换牌子,也很少投诉“不耐用”。此时必须做抽样检测,就得用到假设检验方法。
在论证新点子很好的时候,也需要先把新点子做出来,再做小范围测试。此时也要用假设检验方法。总之,假设检验方法适合于抽样检验/小范围测试的场景。
三、假设检验是怎么验的?
众所周知:证伪比证真容易多了。证真要穷尽各种可能,证伪只要找到反例即可。假设检验的基本思路也是如此,它利用了“小概率事件,不可能在一次小范围抽样中发生”的朴素原理,先提一个假设,之后看能否用小概率事件推翻它。能推翻的,就说明假设不成立;不能推翻,就至少说明不能推翻(是否接受假设,可以再验证)。
基于这个原理,我们一般把要怼翻的结论,作为原假设。然后试着去怼翻它!(如下图)
很多小伙伴在这里犯迷糊:到底原假设是啥?最简单的判断方法,就是:想怼翻什么,就把什么放原假设(记得带等号的一定在原假设)。不过实践的时候,还是经常会写错,这里需要多加练习才行。
设定原假设以后,还要设定“小概率事件”到底有多小。一般用显著性水平α来表示。α是一个人工给定的数,一般给0.10,0.05,0,01看起来够小就行。
四、得到假设以后怎么操作?
得到假设后,需要选择合适的检验统计量,代入参数,计算是否属于小概率事件。
检验统计量,和要检验的假设有关系。比如上述产品使用寿命问题,是一个典型的单总体(只有一个产品要检验)+均值(使用寿命,指的是待检测产品的平均寿命)检验问题,因此可以选用t检验。如果是比例检验问题(比如检验产品的合格率,合格率=问题样本/全部抽检样本),则可以使用Z统计量(如下图)
有了统计量以后,可以检验是否属于小概率事件。不同的假设,拒绝不同
关于拒绝区域,有个简单的记忆方法,就是:
如果假设是等号,拒绝区域就是左右两侧。潜台词就是:既然咱俩相等,那检验值应该不大不小才对。 如果假设是小于号,拒绝区域就是右侧。潜台词就是:既然你比我小,那检验值肯定不太大呀 如果假设是大于号,拒绝区域就是左侧。潜台词就是:既然你比我大,那检验值肯定不能太小呀
这样就容易区分了
当然,有很多统计软件/算法直接给了P值,大家记得:P值小于0.05就拒绝原假设即可。
五、看个简单的例子
某产品经理宣称,目标用户80%都是年轻人(25岁以下),现随机抽样200人,发现146名年龄在25岁以下,问:我们能怼翻产品经理的结论不?
解答过程如下:
原假设被拒绝掉了,我们可以认为产品经理在吹逼,打完收工!
六、从假设检验到ABtest
实际上,假设检验的类型很丰富。为了小伙伴们理解方便,上边举的是最简单的单总体问题。单总体问题,常见于已经有了一个预设结论,之后推翻这个结论的情况。比如证明新版本A比老版本的数据好看。
我们常说的ABtest,如果是真的是设计两个版本A版和B版,之后再检验AB版的区别,则涉及2个总体的均值/比例检验,需要用到不同的统计量。
以上检验均值/比例的方法,统称参数检验,还有非参数检验,比如检验身高和体重之间是否有关系。这些方法在实际工作中有不同的应用场景,之后再慢慢介绍吧。
今天的分享就到这里,如果没听懂也没关系,后续小熊妹还是会努力讲清楚的。喜欢的话,记得转发+在看+点赞,支持下小熊妹哦,谢谢大家。
算法资料领取!